(19) 



Europaisches Patentamt 
European Patent Office 
Office europeen des brevets 



EP 1 363 272 A1 



(12) 



DEMANDE DE BREVET EUROPEEN 



(43) 


Date de publication: 


(51) Intel 7 - G10L 19/04 H04M 1/725 




19.11.2003 Bulletin 2003/47 


(21) 


Numero de depot: 03291085.3 




(22) 


Date de depot: 06.05.2003 






Ftatc fnntrar^ta ntc Hocinnoc 
diaLo oui hi dUlai llo Ucoiyi ico. 


o Rrti irm^uctAr Iwan 
uvjui iiicyoici , Ivan 




AT BE BG CH CY CZ DE DK EE ES Fl FR GB GR 


75015 Paris (FR) 




HI J IF IT 1 1 I II Mf* Nl PT RH QF QIC TR 


w rouiquin, Advier 




Etats d'extension designes: 


92310 Sevres (FR) 




AL LT LV MK 


» Ladouce, Pierre 






95130 Franconville (FR) 


(30) 


Priorite: 16.05.2002 FR 0206035 








(74) Mandataire: Korakis-Menager, Sophie 


(71) 


Demandeur: ALCATEL 


Compagnie Financiere Alcatel 




75008 Paris (FR) 


Departement de Propriete Industrie! le, 






5, rue Noel Pons 


(72) 


Inventeurs: 


92734 Nanterre Cede* (FR) 


O 


Bonnard, Pierre 






92150 Suresnes (FR) 





(54) Terminal de telecommunication permettant de modifier la voix transmise lors d'une 
communication telephonique 



(57) La presente invention concerne un terminal de 
telecommunication permettant de modifier la voix trans- 
mise lors d'une communication telephonique, plus par- 
ticulierement adapte a un systeme de telephonie mobi- 
le. A cet effet, le terminal (8) comporte des moyens (9) 
d'entree par Putilisateur dudit terminal d'un signal de pa- 
role analogique, des moyens (10) pourconvertir ledit si- 



gnal de parole analogique en un signal num^rique, un 
vocodeur (1 1 ) pour executer un codage de source dudit 
signal de parole, ledit vocodeur (11) incluant des 
moyens pour extraire des parametres de reconstruction 
dudit signal de parole. Le terminal est caracterise en ce 
qu'il comporte des moyens (13) pour modifier les para- 
metres de reconstruction de sorte que la voix transmise 
associee au dit signal soit modifiee. 
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Description 

[0001 ] La presente invention concerne un terminal de 
telecommunication permettant de modifier la voixtrans- 
mise lors d'une communication telephonique, plus par- 
ticulierement adapte a un systeme de telephonie mobi- 
le. 

[0002] Meme si la transmission de la parole reste 
Pelement essentiel de la telephonie mobile il n'en de- 
meure pas moins que les fabricants cherchent a diffe- 
rencier leurs produits en offrant de nouveaux services 
attractifs et distrayants pour le consommateur. Les jeux, 
les services lies a la reconnaissance vocale ou la mul- 
tiplication des sonneries d'appel en sont des exemples. 
[0003] Ces nouveaux services impliquent souvent un 
cout supplemental sur le telephone lie a I'ajout d'ele- 
ments logiciels ou materiels. 

[0004] La presente invention vise a fournir un terminal 
de telecommunication offrant un service de modification 
de la voix transmise par I'utilisateur du terminal lors 
d'une communication telephonique, ce service ayant un 
caractere attractif et distrayant et etant mis en oeuvre 
de facon simple et economique. 

[0005] La presente invention propose a cet effet un 
terminal de telecommunication comportant des moyens 
d'entree par I'utilisateur dudit terminal d'un signal de pa- 
role analogique, des moyens pour convertir ledit signal 
de parole analogique en un signal numerique, un voco- 
deur pour executer un codage de source dudit signal de 
parole, ledit vocodeur incluant des moyens pour extraire 
des parametres de reconstruction dudit signal de paro- 
le, caracterise en ce que ledit terminal comporte des 
moyens pour modifier lesdits parametres de reconstruc- 
tion de sorte que la voix transmise associee au dit signal 
soit modifiee. 

[0006] Grace a Pinvention, la mise en place d'un ser- 
vice de modification de la voix transmise par un telepho- 
ne mobile se fait de facon simple et economique en uti- 
lisant un vocodeur deja present dans le telephone pour 
le codage de la voix. Les parametres de reconstruction 
sont representatifs de la voix a transmettre et leur mo- 
dification permet d'agir directement sur la sonorite de la 
voix transmise. 

[0007] Avantageusement, lesdits moyens pour modi- 
fier les parametres de reconstruction component des 
moyens pour modifier la frequence fondamentale de la 
voix. 

[0008] Selon un mode de realisation, ledit codage de 
source du signal de parole est un codage RPE-LTP (Re- 
gular Pulse Excitation Long Term Prediction). 
[0009] De maniere avantageuse, lesdits moyens pour 
modifier les parametres de reconstruction comportent 
des moyens pour modifier les parametres de filtre court 
terme dudit vocodeur. 

[0010] Les parametres de filtre court terme sont par 
exemple les coefficients de reflexion, dits coefficients 
LAR (Log Area Ratio) determines pendant un codage 
du type RPE-LTP. 
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[0011] Selon une variante, lesdits moyens pour mo- 
difier les parametres de reconstruction comportent des 
moyens pour modifier les parametres de filtre long ter- 
me dudit vocodeur. 
5 [0012] Un parametre de filtre long terme est par 
exemple la frequence fondamentale associee a un pitch 
determine pendant un codage du type RPE-LTP. 
[0013] Avantageusement, lesdits moyens pour modi- 
fier les parametres de reconstruction comportent des 
10 moyens pour modifier les parametres associes a des 
grandeurs d'excitation dudit vocodeur. 
[0014] Un parametre associe a une grandeur d'exci- 
tation peut etre par exemple un parametre definissant 
le signal impulsionnel d'excitation determine pendant un 
15 codage RPE-LTP. 

[0015] Selon un mode de realisation, lesdits moyens 
pour modifier les parametres de reconstruction compor- 
tent des moyens pour modifier lesdits parametres en 
fonction de donnees codees representatives d'un en- 
20 semble de notes definies par leurs frequences et leurs 
durees respectives. 

[0016] Avantageusement, le terminal comporte des 
moyens de selection d'un type de modification de la voix 
a transmettre. 

25 [0017] De maniere avantageuse, le terminal compor- 
te des moyens pour configurer manuellement les modi- 
fications des dits parametres de reconstruction du signal 
de parole. 

[0018] Selon un mode de realisation, le terminal com- 
30 porte des moyens pour executer lesdites modifications 
dans un mode de test. 

[0019] De maniere avantageuse, le terminal est un te- 
lephone mobile. 

[0020] D'autres caracteristiques et avantages de la 
35 presente invention apparaitront dans la description sui- 
vante d'un mode de realisation de I'invention donne a 
titre illustratif et nullement limitatif. 
[0021] Dans les figures suivantes : 

40 o La figure 1 represente schematiquement un termi- 
nal de telecommunication selon I'invention, 
o La figure 2 represente schematiquement les 
moyens de codage et de modification de la voix uti- 
lises dans un terminal de telecommunication selon 
45 I'invention, utilisant un codage RPE-LTP conforme 
au standard GSM 06.10. 

[0022] Dans toutes les figures, les elements com- 
muns portent les memes nurneros de reference. 
50 [0023] La figure 1 represente un terminal de telecom- 
munication 8 selon I'invention tel qu'un telephone mobi- 
le. 

[0024] Le terminal 8 comporte un microphone 9, un 
convertisseur analogique numerique 10, un vocodeur 
55 11, un formateur de donnees 12, des moyens 13 pour 
modifier des parametres de reconstruction de la voix, 
des moyens 14 de selection d'un type de modification 
de la voix a transmettre, des moyens 1 5 pour configurer 
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manuellement les modifications des parametres de re- 
construction du signal de parole et des moyens 1 6 pour 
executer des modifications dans un mode de test. 
[0025] Le vocodeur 11, le formateur de donnees 12 
et les moyens 13 pour modifier ies parametres de re- 
construction de ia voix vont etre decrits ci dessous en 
relation avec la figure 2. 

[0026] La figure 2 represente un vocodeur 11 pour 
executer un codage RPE-LTP conforme au standard 
GSM 06. 1 0, un formateur 1 2 de flux de donnees et des 
moyens 13 de modifications de parametres de recons- 
truction de la voix. Le vocodeur 11 , le formateur 12 et 
les moyens 13 sont des moyens logiciels executes par 
un processeur programmable non represente. 
[0027] Le vocodeur 11 inclut des moyens 2 de deter- 
mination de coefficients de reflexion LAR, des moyens 
3 de determination d'une frequence fondamentale de la 
voix et des moyens 4 de determination d'un signal im- 
pulsionnel d'excitation, a partir d'un signal S echantillon- 
ne. 

[0028] Le principe du codage RPE-LTP consiste a 
mod6liser le signal de parole comme un filtre lineaire 
dont les parametres evoluent dans le temps, ledit filtre 
lineaire 6tant excite par un signal impulsionnel. Des lors, 
on comprend que I'objectif de ce codage est de deter- 
miner le signal impulsionnel d'excitation, les differents 
parametres definissant le filtre lineaire et la frequence 
fondamentale de la voix a transmettre. Ce type de co- 
dage de la parole opere sur des trames de 20 ms sur la 
bande [300-3400 Hz]. Le filtre lineaire se decompose 
en deux parties : une premiere partie qui prend en 
compte les correlations a courts termes du signal de pa- 
role et une deuxleme partie qui prend en compte les cor- 
relations a long terme du signal de parole. On parlera 
dans ce qui suit de filtre court terme et de filtre long ter- 
me. 

[0029] Le signal S constitue une trame de parole de 
20 ms echantillonnee a 8 kHz. 

[0030] Les moyens 2 permettent de determiner les 
coefficients de reflexion LAR du filtre court terme. On 
utilise pour cela I'algorithme de Durbin qui est applique 
au signal filtre afin d'en obtenir une prediction lineaire. 
L'algorithme de Durbin genere dix coefficients de re- 
flexion, dits coefficients LAR, compris entre -1 et 1 ex- 
primes a I'echelle logarithmique LAR (Log Area Ratio). 
[0031] Les moyens 3 de determination d'une frequen- 
ce fondamentale de la voix utilisent un procede de pre- 
diction associe au filtre long terme sur des trames de 5 
ms et permettent de reproduire la frequence fondamen- 
tale associee a un pitch P compris entre 56 et 444 Hz 
et caracteristique du locuteur ainsi que le gain associe 
a cette frequence. 

[0032] Les moyens 4 permettent de determiner le si- 
gnal impulsionnel I d'excitation. 

[0033] L'ensemble des donnees foumies par les 
moyens 2, 3 et 4 pour une trame de 20 ms est formate 
dans le formateur 1 2 de flux de donnees qui va produire 
un signal de parole C code. 



[0034] Lorsque ces parametres sont definis, on peut 
produire differents effets sur la voix en modifiant lesdits 
parametres LAR, P et I. Les moyens de modification 13 
permettent de modifier ces differents parametres. 
5 [0035] Ainsi, les moyens 13 de modification peuvent 
modifier uniquement la valeur du pitch associee a la fre- 
quence fondamentale de facon a transformer une voix 
d'homme en une voix defemme. Pour cela, la valeur de 
pitch P de chaque trame est modifiee en une valeur Min 
(P + P e ffet» Max ( p ))> p effet ® tant une valeur predefinie, 
par exemple a 90 Hz, et Max (P) etant la valeur de pitch 
maximale acceptee par le systeme standard. En effet, 
une voix masculine a une valeur de pitch a environ 120 
Hz alors qu'une voix feminine a une valeur de pitch a 
environ 210 Hz. 

[0036] Les moyens 13 de modification peuvent pro- 
ceder de facon similaire pour transformer une voix de 
femme en une voix d'homme. Pour cela, la valeur de 
pitch P de chaque trame est modifiee en une valeur Max 
( p " p effet> M ' n ( p ))> p effet 6tant une valeur predefinie a 
90 Hz et Min (P) etant la valeur de pitch minimale ac- 
ceptee par le systeme standard. 
[0037] On peut 6galement obtenir un effet dechucho- 
tement lorsque les moyens 13 modifient le pitch et le 
gain. Pour cela, les moyens de modification 13 augmen- 
ted le pitch et diminuent le gain de sorte que la sortie 
du signal du filtre long terme soit substantiellement mo- 
difiee en diminuant I'effet des vibrations des cordes vo- 
cales. Les parametres LAR restent inchanges. 
[0038] On peut aussi obtenir un effet de voix robotisee 
lorsque les moyens 1 3 modifient les parametres du filtre 
long terme. Pour cela, le pitch est fixe a une valeur re- 
lativement 6lev6e. Comme pour I'effet de chuchote- 
ment, la prosodie, c'est a dire l'ensemble des elements 
phoniques qui caract^risent le langage parle, est com- 
pletement modifiee et transformee en un son monotone 
ayant une frequence fondamentale unique et des para- 
metres LAR inchang6s. 

[0039] Une autre propriete remarquable des parame- 
tres des codeurs de voix concerne le fait que les para- 
metres LAR represented le trajet vocal et le trajet nasal 
lies a la production de parole, ces deux trajets pouvant 
etre modelises par des filtres de resonance du type filtre 
« tout pole », chaque pole representant une frequence 
de resonance. Des lors, la production de la parole fai- 
sant intervenir le trajet vocal et le trajet nasal, les 
moyens 13 peuvent modifier ces parametres de sorte 
que les voyelles resonnent comme celles d'une person- 
ne qui a le nez bouche. 

[0040] Le trajet vocal et le trajet nasal peuvent chacun 
etre modelises par un filtre tout pole mais la somme de 
ces deux filtres n'est pas tout pole. Pour modeliser la 
combinaison de ces deux trajets sous la forme d'un filtre 
tout pole, il faut construire un zero en placant deux poles 
cote a cote. Ce zero represente la contribution de la ca- 
vite nasale sur la cavite vocale. 

[0041] En rapprochantces deux p6les cote a cote, les 
moyens de modification 13 diminuent la contribution de 
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la cavite nasale et donnent ainsi un effet « enrhume » a 
la voix. 

[0042] Les parametres peuvent egalement etre modi* 
fies en fonction de donnees codees representatives 
d'un ensemble de notes definies par leurs frequences 
et leurs durees respectlves. Ainsi la voix modifiee peut 
suivre une partition definie dans un format de codage 
definissant un ensemble de couples (frequence, duree) 
et avoir ainsi un effet chante._Une partition est fournie 
aux moyens 13 de modification des parametres de re- 
construction. Cette partition peut etre sous un format de 
codage demusique MIDI, SMAFde Yamaha®, EMR R5 
polyphonique, IrDA iMelody de I'lrMC (Infrared Mobile 
Communications) ou un autre format de description vec- 
toriel de la musique. Dans une etape de pretraitement, 
la partition esttranscrite automatiquement, si necessai- 
re, pour que les frequences des notes soient dans I'in- 
tervalle[56 Hz, 444 Hz]. 

[0043] Les notes sont interpretees en duree et en fre- 
quence, a chaque note correspondant une date de de- 
but, une date de fin et une frequence. Les trames de 
parole de 5 ms sont modifiees par les moyens 13 pour 
que le pitch de la parole soit egal a la frequence de la 
note correspondante au meme instant. 
[0044] Les modifications des parametres se font ge- 
neralement via des echanges entre le formateur de flux 
de donnees et les moyens 1 3 pour modifier les parame- 
tres. Toutefois, on peut egalement envisager des modi- 
fications des parametres faites directement au niveau 
du vocodeur 11 . 

[0045] En figure 1 , I'utilisateur a la possibility de se- 
lectionner le type d'effets souhaite sur la voix a trans- 
mettre via les moyens 14 de selection d'un type de mo- 
dification. II peut egalement configurer manuellement 
les modifications des parametres de reconstruction du 
signal de parole via les moyens 15. Ainsi, il peut par 
exemple influer sur la valeur du pitch modifie a Min (P 
+ P effet , Max (P)) dans le cas d'une transformation de 
voix masculine en voix feminine en fixant iui-meme la 
valeur de P effet . II peut egalement tester I'effet obtenu 
via les moyens 16 qui lui permettent d'executer le type 
de modification selectionnee avec les parametres tels 
qu'il les a fixes. 

[0046] Lors d'une communication mobile, la voix de 
I'utilisateur est d'abord echantillonnee et numerisee par 
les moyens 9. Elle est ensuite codee par le vocodeur 
1 1 , lequel met en oeuvre I'etape 7 tel que decrite en re- 
lation avec la figure 1 . 

[0047] La voix codee est ensuite formatee par le for- 
mateur 12 sous forme de parametres de reconstruction 
de la voix obtenus grace au vocodeur 11 . 
[0048] Les moyens 13, commandes par les moyens 
1 4, 1 5 et 1 6 vont alors modifier les parametres formates 
de reconstruction de la voix pour obtenir les effets re- 
cherches par I'utilisateur. Les parametres modifies sont 
ensuite retransmis aux moyens 12 puis sont envoyes a 
I'interlocuteur via le reseau de telecommunication ou 
executes en mode test pour I'utilisateur. 
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[0049] On peut egalement envisager une modification 
des parametres de reconstruction directement au ni- 
veau des moyens 11 par les moyens 13. 
[0050] Bien entendu, invention n'est pas limitee au 

5 mode de realisation qui vient d'etre decrit. 

[0051] Notamment, le mode de realisation porte sur 
un codage de source du type RPE-LTP mais on peut 
envisager tout autre codage de source tel que par exem- 
ple I'ETS 300 726 GSM EFR (Enhanced Full Rate) et le 

10 3GPP TS 26.071 AM (Adaptive Multirate). 



Revendications 

15 1 . Terminal (8) de telecommunication comportant des 
moyens (9) d'entree par I'utilisateur dudit terminal 
d'un signal de parole analogique, des moyens (10) 
pour convertir ledit signal de parole analogique en 
un signal numerique (S), un vocodeur (1 1 ) pour exe- 
20 cuter un codage de source dudit signal de parole 
(S), ledit vocodeur (11) incluant des moyens (11) 
pour extraire des parametres de reconstruction du- 
dit signal de parole, caracterise en ceque ledit ter- 
minal (8) comporte des moyens (13) pour modifier 
25 lesdits parametres de reconstruction de sorte que 
la voix transmise associee au dit signal soit modi- 
fiee. 

2. Terminal(8) selon la revendication precedente ca- 
se racterise en ce que lesdits moyens (13) pour mo- 
difier lesdits parametres de reconstruction compor- 
tent des moyens pour modifier un parametre repre- 
sentatif de la frequence fondamentale de la voix. 

35 3. Terminal (8) selon Tune des revendications prece- 
dentes caracterise en ce que ledit codage de sour- 
ce du signal de parole est un codage RPE-LTP. 

4. Terminal (8) selon Tune des revendications prece- 
40 dentes caracterise en ce que lesdits moyens (1 3) 
pour modifier lesdits parametres de reconstruction 
component des moyens pour modifier les parame- 
tres de filtre court terme dudit vocodeur. 

45 5. Terminal (8) selon Tune des revendications prece- 
dentes caracterise en ce que lesdits moyens (13) 
pour modifier lesdits parametres de reconstruction 
comportent des moyens pour modifier les parame- 
tres associes a des grandeurs d'excitation. 

50 

6. Terminal (8) selon Tune des revendications prece- 
dentes caracterise en ce que lesdits moyens (13) 
pour modifier lesdits parametres de reconstruction 
comportent des moyens pour modifier les parame- 

55 tres de filtre long terme dudit vocodeur. 

7. Terminal (8) selon Tune des revendications prece- 
dentes caracterise en ce que lesdits moyens (13) 
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pour modifier lesdits parametres de reconstruction 
comportent des moyens pour modifier lesdits para- 
metres en fonction de donnees codees representa- 
tives d'un ensemble de notes definies par leurs fre- 
quences et leurs durees respectives. 5 

8. Terminal(8) selon Tune des revendications prece- 
dentes comportant des moyens (14) de selection 
d'un type de modification de la voix a transmettre. 

10 

9. Terminal selon Tune des revendications preceden- 
tes comportant des moyens (15) pour configurer 
manuellement les modifications desdits parame- 
tres de reconstruction du signal de parole. 

15 

10. Terminal selon Tune des revendications preceden- 
tes comportant des moyens (1 6) pour executer les- 
dites modifications dans un mode de test. 

11. Terminal selon Tune des revendications preceden- 20 
tes caracterise en ce que ledit terminal est un te- 
lephone mobile. 
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